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摘 要 将 机 器 学 习 应 用 于 精神 疾患 的 临床 和 基础 研究 


心理 疾病 临床 医学 研究 中 心 (北京 大 学 第 六 医院 ), 北京 100191) 


是 近年 来 的 趋势 。 研究 者 将 机 器 学 习 应 用 于 精神 分 裂 


JRA BEA BEY TL 加 权 像 和 弥散 张 量 成 像 的 脑 影像 数据 中 , 为 了 解 疾 病 的 生理 病理 学 机 制 提 供 帮 助 。 回 
顾 以 往 研 究 发 现 额 叶 及 矣 叶 的 脑 结构 特征 具有 较 高 的 区 分 能 力 ， 行 为 数据 和 脑 影像 数据 结合 的 分 类 效果 优 于 
单 模 态 数据 。 现 阶段 研究 存在 样本 量 不 足 和 泛 化 能 力 和 欠缺 的 局 限 ， 未 来 研究 应 注意 扩大 样本 量 、 制 定 标 准 化 
的 分 类 方法 ， 从 而 进一步 探究 机 器 学 习 在 精神 疾患 中 的 作用 。 


关键 词 
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精神 分 裂 症 是 一 种 严重 的 精神 障碍 ， 患 病 率 
约 为 1%， 患 者 表现 出 思维 方式 和 行为 举止 怪异 、 
感知 觉 扭曲 、 认 知 失 调 等 症状 并 且 常 伴 有 情感 迟 
钝 、 社 会 退缩 等 特征 (Carpenter & Buchanan, 1994)。 
近年 来 ， 研 究 者 利用 脑 影像 技术 发 现 精神 分 裂 症 
患者 的 脑 结 构 存 在 异常 ,包括 灰质 体积 和 密度 改 
变 , 白质 异常 和 脑室 体积 增 大 等 ,为 理解 精神 疾 
病 的 病理 机 制 提供 支持 (Bakhshi & Chance, 2015; 
Palaniyappan, 2017)。 现 阶段 精神 分 裂 症 脑 影像 研 
究 多 采用 临床 患者 和 健康 对 照 的 组 间 均 值 差异 检 
验 来 考察 患者 的 异常 特征 ,然而 这 一 方法 获得 的 
结果 无 法 应 用 到 个 体 水 平 上 ， 机 器 学 习 (Machine 
Learning) 技 术 可 以 弥补 以 上 不 足 。 机 器 学 习 这 一 
概念 最 早 由 IBM (International Business Machines 
Corporatiom) 公 司 的 Arthur Samuel (1959) 提 出 。 
Tom Mitchell 提出 更 广泛 且 正 式 的 机 器 学 习 定 义 : 
“对 于 某 类 任务 T 和 性 能 度量 P, 如 果 一 个 计算 机 
程序 在 T 上 以 P 衡量 的 性 能 随 着 经 验 EE 而 自我 完 
善 , 那么 称 这 个 计算 机 程序 在 从 经 验 E 学 习 ” 
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(Mitchell, 1997)。 在 精神 疾病 领域 , 研究 者 利用 机 
器 学 习 从 脑 影像 数据 中 学 得 规律 、 构 建 模型 并 利 
用 模型 在 个 体 水 平 上 进行 预测 ， 同 时 发 现 最 具有 
鉴别 能 力 的 特征 。 
目前 已 经 有 研究 者 利用 机 器 学 习 分 类 方法 ， 
尝试 探讨 如 何 从 人 和 群 中 识别 出 精神 分 裂 症 患 者 
(Ardekani et al., 2011; Nieuwenhuis et al., 2012; 
Winterburn et al., 2017) 、 从 高 危 人 群 中 识别 出 未 
来 转变 为 精神 分 裂 症 患者 的 个 体 (Zarogianni,，Storkey, 
Johnstone, Owens, & Lawrie, 2017) 以 及 区 分 处 于 
不 同 疾 病 阶段 的 临床 患者 (Guo，Palaniyappan,， 
Liddle, & Feng, 2016)。 在 训练 模型 的 过 程 中 , 模 
型 选取 的 特征 一 般 是 能 够 区 分 各 类 别 的 显著 特征 
因此 精神 分 裂 症 患 者 、 高 危 人 群 和 健康 对 照 的 机 
器 学 习 分 类 研究 可 以 为 精神 分 裂 症 的 疾病 诊断 、 
预后 判断 、 疗 效 判 断 的 相关 生物 标记 物 的 寻找 提 
供 帮 助 。 

本 文 将 从 以 下 四 个 方面 进行 系统 论述 : 首先 
简要 阐述 机 器 学 习 的 主要 步骤 ,其 次 对 以 往 利 用 
脑 结构 像 对 精神 分 裂 症 患者 及 高 危 人 群 开展 的 机 
器 学 习 人 研究 进行 系统 梳理 ， 并 讨论 现 阶段 精神 分 
裂 症 领域 机 器 学 习 研 究 的 局 限 ， 最 后 提出 未 来 研 
究 方 向 。 
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1 机 器 学 习 的 主要 步骤 


将 机 器 学 习 应 用 于 精神 分 裂 症 的 脑 结构 像 
(structural Magnetic Resonance Imaging, sMRT) 数 
据 时 ， 主 要 步 又 包括 从 脑 影像 中 提取 特征 数据 、 
竺 征 降 维和 特征 选择 、 训 练 模型 、 评 估 模 型 以 及 
利用 模型 预测 新 样本 ( 见 图 1)。 

11 提取 数据 
在 精神 分 裂 症 的 脑 结构 像 研究 中 ,采用 高 信 
品 比 的 大 脑 图 像 是 分 析 的 基础 。 研 究 者 应 进行 图 
像 质量 控制 ， 以 保证 用 于 机 器 学 习 数 据 的 可 靠 性 
和 有 效 性 。 从 脑 影 像 中 提取 数据 后 ， 数 据 集 将 被 
分 割 成 训练 集 和 测试 集 或 者 训练 集 、 验 证 集 和 测 
试 集 。 研 究 者 使 用 训练 集 数据 寻找 规律 、 生 成 模 
型 ， 利 用 验证 集 数 据 调 整 模型 参数 、 选 择 最 优 模 
型 ， 最 终 使 用 测试 集 数据 检验 最 终 模 型 的 性 能 。 
1.2 ”特征 降 维 和 特征 选择 

寺 征 降 维 和 特征 选择 能 有 效 提高 模型 的 泛 化 
能 力 ， 是 数据 处 理 的 重要 步骤 ,对 高 维 数据 的 处 理 
尤为 重要 。 特 征 降 维 是 高 维 数据 转变 成 低 维 数据 的 
过 程 ， 常 用 方法 是 主 成 分 分 析 (Principal Components 
Analysis, PCA)。 特 征 选 择 是 从 原始 或 降 维 后 的 数 
据 中 选取 具有 最 佳 分 类 效果 的 特征 子 集 的 过 程 ， 
该 子 集 的 类 别 分 布 应 与 原始 数据 的 类 别 分 布 相似 。 
Guyon, Weston, Barnhill 和 Vapnik (2002) 基 于 评价 


“将 样本 分 成 训练 集 、 验 证 集 和 测试 集 


“从 脑 影像 中 提取 特征 数据 ， 


数据 处 理 : 特 | .降低 数据 的 维度 
征 降 维和 特征 |, 渤 择 最 能 区 分 类 别 的 特 全 


准则 将 特征 选择 方法 分 为 过 滤 法 (Filter)、 包 装 法 
(Wrapper) Flik A (Embedded), 三 类 特征 选择 方 
法 在 精神 分 裂 症 的 脑 影像 分 类 研究 中 均 有 应 用 。 
过 滤 法 根据 特征 的 统计 指标 或 特征 与 类 别 之 间 尽 
相关 性 对 特征 进行 评分 ,根据 设 定 的 阔 值 或 设 定 
的 个 数 选择 特征 ， 有 助 于 降低 特征 之 间 的 相关 性 ， 
提高 特征 与 类 别 之 间 的 相关 性 。 包 装 法 是 根据 算 
法 的 分 类 性 能 增 减 特征 ， 如 使 用 基于 支持 向 量 
机 的 递归 特征 消除 方法 (Support Vector Machine- 
Recursive Feature Elimination，SVM-RFE) 选 择 特 
征 。 瞬 入 法 合并 特征 选择 和 分 类 器 训练 过 程 ,在 
训练 过 程 中 自动 选择 最 优 特征 子 集 ， 如 决策 树 算 
法 在 训练 过 程 中 优先 选择 分 类 能 力 更 强 的 特征 。 
除 此 之 外 ， 研 究 者 还 可 以 根据 以 往 文 献 选择 或 移 
除 特征 ， 例 如 将 精神 分 裂 症 患者 受 药物 影响 较 大 
的 纹 状 体 的 影像 数据 移 除 (Nieuwenhuis et al., 2012)。 
13 ”训练 模型 

人 研究 者 利用 机 器 学 习 算 法 寻找 脑 影像 数据 规 
律 并 生成 模型 。 机 器 学 习 算 法 一 般 分 为 监督 学 习 
和 无 监督 学 习 ， 区 别 在 于 算法 是 否 使 用 样本 数据 
的 分 类 信息 或 目标 值 。 在 精神 分 裂 症 的 研究 中 ， 
人 研究 者 通常 使 用 支持 向 量 机 (Support Vector Machine, 
SVM) 、 线 性 回归 (Linear Regression) 等 监督 学 习 算 
法 探究 精神 分 裂 症 患者 或 高 危 人 群 和 健康 对 照 的 


分 类 问题 。 


ia f . 寻找 样本 数据 的 规律 
训练 模型 |。 生成 分 类 模型 模型 不 完善 时 , 进行 油 参 
等 操作 ,重新 生成 模型 


I 预测 新 样本 “| . 使 用 模型 预测 新 样本 


图 1 脑 影 像 数据 的 机 天 学 习 分 析 步 又 
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14 评估 模型 和 利用 模型 预测 新 数据 

泛 化 能 力 是 指 模型 适用 于 新 数据 的 能 力 ， 研 
究 者 利用 性 能 度量 来 衡量 模型 汉化 能 力 , 评估 模 
型 优 劣 (周志 华 ,2016)。 在 精神 分 裂 症 的 研究 中 ， 
正确 率 (Accuracy) 、 敏 感性 (Sensitivity) 即 查 全 率 
(Recall), Æ WEK (Precision) FAFS PE (Specificity) 
是 最 直观 的 性 能 度量 。 正 确 率 是 判断 正确 的 样本 
数 占 样本 总 数 的 百分比 。 敏 感性 指 所 有 阳性 样本 
中 真 阳 性 样本 的 比例 。 查 准 率 指 真 阳性 样本 占 判 
定 为 真 的 样本 的 百分比 。 特 异性 指 真 阴性 样本 占 
所 有 阴性 样本 的 百分比 。 根 据 性 能 度量 结果 ， 研 
究 者 采取 更 改 算法 、 调 节 模 型 参数 等 方法 调整 模 
型 。 最终 模 型 确立 后 ， 可 用 来 预测 新 数据 的 类 别 。 
15 ”交叉 验证 

交叉 验证 是 特征 选择 、 参 数 调 整 和 最 终 模型 
检验 中 评估 模型 性 能 的 有 效 方 法 , 数据 处 理 操 作 
(如 特征 降 维 和 特征 选择 ) 必 须 骨 入 在 交叉 验证 中 。 
K 折 交 又 验 证 (K-fold cross validation, K-fold CV) 
是 最 常见 的 交叉 验证 方法 , 它 将 样本 分 为 K 份 ， 
每 次 取 K-1 份 为 训练 集 ， 剩 下 1 份 为 测试 集 ， 将 
平均 正确 率 作为 最 终 预测 结果 。 在 大 多 数 研 究 中 ， 
研究 者 选择 使 用 5 折 或 10 折 交 叉 验 证 ， 也 可 根据 
样本 大 小 和 数理 统计 标准 确定 K 值 (Dwyer, Falkai, 
& Koutsouleris，2018)。 由 于 受到 样本 量 的 限制 ， 
让 影像 的 机 器 学 习 研 究 通常 采用 折 交 叉 验证 法 
的 特殊 形式 留 一 法 (Leave One Out Cross Validation, 
LOOCV), 其 K 取样 本 总 数 N。 留 一 法 虽然 简单 ， 
但 具有 高 偏差 、 高 耗 时 等 缺点 。 

另外 ， 有 人 研究 者 建议 使 用 般 套 交 又 验证 (Nested 
Cross Validation) (Madsen, Krohne, Cai, Wang, & Chan, 
2018)。 髓 套 交 叉 验 证 包括 评估 模型 性 能 的 外 循环 
和 用 于 选择 最 优 特 征 、 最 优 参数 的 内 循环 ， 令 小 
样本 数据 集 能 够 采用 不 同 的 数据 来 评估 模型 和 选 
择 特征 、 调 整 参数 ， 最 大 程度 减少 偏差 ， 缓 解 小 样 
本 数据 的 可 用 性 问题 ， 提 高 评估 结果 的 可 信和 度 。 
目前 已 有 多 篇 脑 影像 数据 机 器 学 习 研 究 使 用 艇 套 
交叉 验证 方法 (Borgwardt et al., 2013; Dyrba, Grothe, 
Kirste, & Teipel, 2015; Peng et al., 2017; Zarogianni et 
al., 2017). 


2 基于 脑 结构 特征 的 精神 分 裂 症 患者 
与 健康 对 照 的 分 类 研究 


结构 像 数据 (包括 Tl 加 权 像 、 弥 散 张 量 成 像 
(Diffusion tensor imaging, DTI) ) 的 机 需 学 习 研 究 
进行 文献 搜索 ,使 用 的 数据 库 包 括 Web of Science, 
PubMed, Elsevier, 采用 的 关键 词 包 括 “structural 
MRI”, “Machine Learning”, “Support Vector Machine”, 
SVM, schizophrenia, “high risk”, schizotype 以 及 


“voxel based morphometry”, VBM, “grey matter”, 


“gray matter”, DTI, “diffusion tensor imaging” 的 不 
同 组 合 。 表 1 中 列 出 截止 到 2019 年 1 月 17 日 搜 
索 到 的 34 篇 文献 的 主要 方法 和 结果 。 

根据 分 类 特征 是 否 来 源 于 同一 模 态 ， 脑 影像 
数据 分 为 单 模 态 数据 和 多 模 态 数据 。 为 探讨 上 述 
两 种 数据 和 不 同 脑 结构 特征 对 精神 分 裂 症 脑 影 像 
的 机 器 学 习 分 类 的 影响 ， 下 文 将 按照 基于 脑 结构 
像 的 单 模 态 机 器 学 习 研 究 、 基 于 DTT 的 单 模 态 机 
器 学 习 研 究 、 多 模 态 机 器 学 习 研 究 、 脑 影像 数据 
和 行为 数据 相 结合 的 机 器 学 习 研 究 这 一 顺序 进行 
综述 。 
2.1 基于 脑 结构 像 的 单 模 态 机 器 学 习 研 究 

基于 脑 结构 像 的 机 器 学 习 研 究 中 ,最 常用 的 
特征 包括 大 脑 灰质 体积 、 白 质 体 积 和 皮层 厚度 。 
在 这 些 研究 中 ,以 慢性 精神 分 裂 症 患者 、 首 发 精 
神 分 裂 证 患者 ， 以 及 精神 病 高 危 个 体 为 对 象 的 分 
类 研究 均 有 报道 。 从 机 器 学 习 的 分 类 表现 上 看 
现 有 研究 的 分 类 正确 率 在 36.84% 到 98% 之 间 ; 在 
特征 方面 ， 使 用 额 叶 、 桔 叶 的 脑 结构 特征 可 以 达 


到 较 高 的 正确 率 。 
2.1.1 ”精神 分 裂 症 


在 精神 分 裂 症 的 分 类 研究 中 ， 总 样本 量 最 小 
值 为 39， 最 大 值 为 606, 多 数 研究 总 样本 量 超过 
100; 分 类 正确 率 在 44.74% 到 98% 之 间 ; 研究 结 
果 指 出 , SLE. SPE. BPE. MP, Be 
EE, RRE, MH. BERT AeA AT ASR 
结构 特征 具有 较 高 的 分 类 正确 率 ; 算法 对 分 类 正 
确 率 的 影响 不 明显 ,特征 选择 方法 可 能 会 影响 分 
类 表现 ， 相 同 特征 对 于 不 同 病 程 患者 的 重要 性 有 
差异 。 

精神 分 有 裂 症 患者 的 脑 结 构 随 病程 改变 ， 有 研 
究 者 采用 98 例 不 同 病 程 的 精神 分 裂 症 患者 和 83 
例 健 康 对 照 的 皮层 厚度 数据 进行 分 析 ， 去 除了 年 
龄 和 性 别 对 皮层 厚度 的 影响 ， 使 用 基于 RBF 
(Radial Basis Functiom) 核 的 SVM 算法 进行 分 类 


我 们 对 2010 年 以 来 精神 分 裂 症 领 域 采 用 脑 


用 留 一 法 验证 ， 获 得 81.77% 的 平均 分 类 正确 率 ， 
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77.55% 的 平均 敏感 性 和 86.75% 的 平均 特异 性 ， 进 
一 步 研究 发 现 病 程 小 于 两 年 的 患者 与 健康 对 照 的 
分 类 正确 率 最 高 (96.3%, 特异 性 为 98.8%、 敏 感性 
为 88%); 患者 尤其 是 长 病程 患者 的 杜 叶 -边缘 系 
统 和 额 叶 -项 叶 的 皮层 厚度 减少 , 但 枕 叶 皮层 厚 
度 增加 (Guo et al., 2016)。 

在 分 类 过 程 中 ， 有 研究 者 提出 与 使 用 全 脑 灰 
质 密度 数据 相 比 ， 利 用 特征 选择 方法 选取 部 分 脑 
区 的 灰质 密度 作为 特征 能 提高 分 类 正确 率 。Chin 
等 (2018) 使 用 序列 感 兴趣 区 选择 方法 (sequential 
region-of-interest (ROI) selection) 在 64 个 脑 区 的 灰 
质 密度 数据 中 选择 最 优 特征 ， 结 果 发 现 使 用 该 特 
征 选择 方法 可 将 84 个 精神 分 裂 症 患者 和 43 个 健 
康 对 照 ( 训 练 集 ) 的 分 类 正确 率 从 86.6% 提 高 到 
92.0%， 将 57 个 精神 分 裂 症 患者 和 28 个 健康 对 照 
(测试 集 ) 的 分 类 正确 率 从 83.5% 提 高 到 89.4%， 同 
时 筛选 出 包含 7 个 ROI 的 最 佳 分 类 子 集 ， 包括 梭 
状 回 、 额 中 回 、 额 下 回 、 显 上 回 、 额 上 回 、 左 丘 
脑 和 左 侧 脑室 。 还 有 研究 者 比较 不 同 特征 选择 方 
法 对 分 类 正确 率 的 影响 。Nieuwenhuis 等 人 (2012) 
采用 基于 体 素 的 形态 学 分 析 (Voxel-Based Morphometry, 
VBM) 提 取 脑 结构 像 每 个 体 素 的 灰质 密度 数据 ， 
用 线性 回归 去 除 年 龄 、 性 别 和 利 手 的 影响 ， 将 残 
差 作为 原始 输入 数据 分别 采 用 由 入 法 和 基于 先 
验 知识 选取 特征 ,前 者 使 用 SVM 算法 训练 模型 ， 
选取 权重 绝对 值 前 10% 的 特征 作为 输入 特征 ， 后 
者 基于 以 往 研 究 去 除 受 药物 影响 的 纹 状 体 的 灰质 
密度 ,将 余下 脑 区 的 灰质 密度 作为 输入 特征 。 使 
用 线性 SVM 算法 在 239 个 被 试 (128 个 患者 和 111 
个 健康 对 照 ) 中 建立 模型 ， 使 用 留 一 法 交叉 验证 。 


Net), LO 范 数 正 则 化 逻辑 回归 (LO Norm Regularized 
Logistic Regressions)， 线 性 SVM, 正则 化 判别 分 
析 (Regularized Discriminant Analysis)， 随 机 森林 
(Random Forests) 和 高 斯 过 程 分 类 (Gaussian Process 
Classifier), 发 现 使 用 这 8 种 算法 得 到 的 分 类 结 
无 较 大 差异 ， 分 类 正确 率 在 74.1% 到 76% 之 间 。 
现 有 研究 不 仅 将 机 器 学 习 应 用 于 区 分 精神 分 
裂 症 患者 和 健康 对 照 ,而且 还 尝试 区 分 不 同 亚 型 
精神 分 裂 症 患 者 。 有 研究 者 使 用 机 器 学 习 区 分 有 
无 强迫 症状 的 精神 分 裂 症 患者 , 在 23 例 无 强迫 症 
状 的 精神 分 裂 症 患者 和 23 例 有 强迫 症状 的 精神 
分 裂 症 患 者 的 样本 中 发 现 中 央 旁 小 叶 ( 包 括 辅助 
运动 区 )、 中 扣 带 回 (middle cingulate gyrus) 和 额 叶 
一 皮层 下 (fronto-subcortical) 区 域 的 灰质 密度 能 很 
好 地 区 分 两 组 被 试 , 正确 率 达 到 78.26% (Tas et al., 
2019). 
2.1.2 首发 精神 分 裂 症 
因 受 到 病程 和 长 期 服用 药物 的 影响 ,慢性 精 
神 分 裂 症 患者 的 脑 结构 可 能 发 生 一 定 的 改变 ， 影 
响 机 器 学 习 研 究 的 分 类 表现 。 首 发 精神 分 裂 症 患 
者 较 少 受到 药物 和 病程 的 干扰 ， 对 这 一 群体 的 研 
究 有 利于 探讨 精神 分 裂 症 的 神经 病理 机 制 。 在 首 
发 精神 分 裂 症 患者 的 分 类 研究 中 ， 总 样本 量 最 小 
仅 为 42, 最 大 达到 480; 分 类 正确 率 在 44.74% 与 
96.7% 之 间 。 在 特征 方面 ,， 额 叶 (如 额 上 回 、 额 中 
回 和 额 极 等 )、 杜 中 回 、 梭 状 回 和 舌 回 的 脑 结构 特 
征 能 提高 分 类 正确 率 。 
分 类 问题 是 研究 者 首要 关注 的 问题 , 在 127 
个 首发 患者 和 127 个 健康 对 照 的 分 类 研究 中 ， 
Squarcina 等 人 (2017) 提 取 68 个 感 兴趣 区 的 皮层 厚 


结果 发 现 采 用 坎 入 法 选取 特征 建立 的 模型 具有 和 较 
好 的 分 类 表现 :71.4% 的 平均 正确 率 , 73.4% 的 平均 
敏感 性 和 69.4% 的 平均 特异 性 ; 最 后 在 277 个 被 
试 (155 个 患者 和 122 个 健康 对 照 ) 的 数据 中 进行 验 
uE, 得 到 70.4% 的 分 类 正确 率 ，67.1% 的 敏感 性 和 
73.8% 的 特异 性 ; 研究 发 现 患 者 额 叶 、 显 上 回 和 海 
马 的 灰质 密度 降低 ， 而 基底 神经 节 和 左 侧 枕 叶 灰 
质 密 度 增 加 。 

除了 使 用 不 同 的 特征 选择 方法 , 研究 者 还 探 
究 不 同 算法 对 分 类 正确 率 的 影响 ，Salvador 等 人 
(2017) 使 用 127 个 健康 对 照 和 128 个 精神 分 裂 症 患 


度数 据 ， 分 别 对 每 个 感 兴趣 区 应 用 SVM 算法 ， 根 
据 分 类 结果 选取 5 个 最 优 特征 ; 利用 最 优 特征 建 
立 模 型 ， 使 用 SVM 或 多 核 学 习 (Multiple Kernel 
Learning，MKL) 算 法 进行 训练 和 预测 ， 在 额 上 回 ， 
额 中 回 只 部 和 杜 中 回 取得 85% 的 最 高 正确 率 。 

在 首发 精神 分 裂 症 患者 中 有 研究 者 探究 了 不 
同 算法 应 用 于 灰质 密度 和 皮层 厚度 数据 的 分 类 表 
Io Winterburn 等 人 (2017) 使 用 逻辑 回归 (Logistic 
Regression, LR), SVM (包括 线性 SVM 和 SVM- 
RBF) 和 线性 判别 分 析 (Linear Discriminant Analysis, 
LDA) 三 种 算法 进行 分 类 ， 脑 结构 像 数据 包括 灰质 


者 的 灰质 体积 探究 不 同 算法 的 分 类 性 能 。 该 研究 
采用 的 算法 包括 Ridge，Lasso， 弹 性 网 络 (Elastic 


密度 和 皮层 厚度 ,数据 样本 包括 50 例 首发 精神 分 
裂 症 患者 和 50 例 健 康 对 照 ， 研 究 者 首先 将 样本 分 
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为 2/3 的 训练 集 和 1⁄3 的 测试 集 ， 应 用 线性 SVM 
算法 于 灰质 密度 数据 时 ， 分 类 正确 率 最 高 可 达 
69.6% (敏感 性 77.8%， 特 异性 57.9%); 使 用 
SVM-RBF 算法 和 皮层 厚度 数据 进行 分 类 ， 最 高 
分 类 正确 率 可 达 73.5% (敏感 性 58.8%， 特 异性 
88.2%)。 
2.1.3 AAR 

与 首发 精神 分 裂 症 患者 相 比 ， 识 别 高 危 人 群 
与 探究 其 脑 结 构 有 利于 解释 精神 分 裂 症 的 发 生机 
制 、 预 测 精 神 疾病 的 发 生 。 目 前 利用 脑 结构 像 对 
高 危 人 群 的 分 类 研究 较 少 ， 总 样本 量 均 不 超过 50, 
分 类 正确 率 在 36.84% 与 72% 之 间 。 其 中 ， 有 研究 
者 使 用 灰质 体积 数据 和 SVM 算法 对 25 名 高 危 个 
体 和 25 名 健康 对 照 个 体 进 行 分 类 ,应 用 留 一 法 进 
行 交叉 验证 ， 获 得 72% 的 分 类 正确 率 (敏感 性 68%, 
特异 性 76%)， 双 侧 海 马 、 海 马 旁 回 、 壳 核 、 额 上 
回 、 额 中 回 、 梭 状 回 和 顶 下 小 叶 , ZejM 8 F 
右 侧 里 上 回 、 左 侧 攀 前 叶 和 左 侧 小 脑 等 区 域 具 
较 高 的 特征 权重 (Valli et al., 2016)。 
2.2 ”基于 弥散 张 量 成 像 的 单 模 态 机 器 学 习 研究 

弥散 张 量 成 像 是 另 一 种 常用 的 脑 结 构成 像 。 
水 分 子 在 脑 中 受到 白质 纤维 (如 髓 靖 和 轴 突 膜 等 ) 
的 约束 ,各 个 方向 上 的 弥散 不 同 , 呈现 各 向 异性 。 
弥散 张 量 成 像 利用 水 分 子 弥散 的 各 向 异性 成 像 ， 
用 于 探究 脑 白质 纤维 束 的 位 置 和 方向 (Meoded， 
Poretti, Mori, & Zhang, 2017)。 现 有 基于 DTI 的 机 
器 学 习 分 类 研究 较 少 ,样本 量 在 42 到 154 之 间 ， 
研究 常 采 用 的 特征 包括 各 向 异性 分 数 (Fractional 
Anisotropy, FA)、 轴 向 弥散 张 量 (Axial Diffusivity, 
AD). 垂直 弥散 张 量 (Radial Diffusivity, RD). 平均 
弥散 率 (Mean Diffusivity，MD) 等 ， 从 机 器 学 习 的 
分 类 表现 上 看 ， 现 有 研究 的 分 类 正确 率 最 低 为 
60%， 最 高 可 达 98%。 

有 研究 者 将 50 名 精神 分 裂 症 患 者 和 50 名 健 
康 对 照 分 为 训练 集 和 测试 集 ， 基于 DTI 数据 计算 
FA 和 MD 值 , 使 用 PCA 降 维 并 在 数据 中 进行 独 
立 样本 t 检验 , BBR P 值 大 于 0.5 的 特征 ,利用 
Fisher 线性 判别 分 析 训 练 模型 。 结 果 发 现 使 用 FA 
值 构建 的 模型 在 测试 集中 获得 94% 正 确 率 (敏感 
性 96%, 特异 性 92%)， 有 区 分 能 力 的 特征 集中 在 
大 脑 深 部 白质 区 域 ， 如 双 侧 外 洁 (external capsule); 
使 用 MD 值 构建 的 模型 在 测试 集中 的 正确 率 为 
98% (敏感 性 96%， 特 异性 100%)， 影 响 正 确 率 的 
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特征 集中 在 皮层 和 脑室 ; 结合 FA 和 MD 数据 进行 
分 类 并 没有 显著 改变 模型 的 分 类 正确 率 ( 正 确 率 、 
敏感 性 和 特异 性 均 为 96%) (Ardekani et al., 2011). 

另外 ， 有 研究 者 基于 DTI 数据 计算 18 条 主要 
HEAR FA, MD. RD 和 AD fH, 使 用 基于 
随机 森林 的 递归 特征 消除 法 (Random Forest-Recursive 
Feature Elimination, RF-RFE) 选 择 特征 ， 采用 随机 
森林 算法 在 52 个 首发 患者 和 48 个 健康 对 照 的 数 
据 中 进行 训练 和 测试 , 得 到 71% 的 分 类 正确 率 ( 敏 
感性 67.3%， 特 异性 75%); 用 最 终 模型 区 分 13 个 
首发 串 者 和 12 个 健康 对 照 得 到 76% 的 分 类 正确 
率 (敏感 性 76.9%, 特异 性 75%), 具有 区 分 能 
的 特征 位 于 连 合 纤维 、 小 脑 - 丘 脑 - 皮 层 回路 (the 
cerebello-thalamo-cortical circuits) 和 长 纤维 (Deng 
et al., 2019)。 

Pettersson-Yeo 等 人 (2013) 利 用 FA 值 分 别 对 
19 个 高 危 个 体 和 23 个 健康 对 照 、19 个 首发 患者 
和 23 个 健康 对 照 进行 分 类 , 使 用 SVM 算法 均 得 
到 65.79% 的 分 类 正确 率 ， 其 敏感 性 均 为 68.42%， 
特异 性 均 为 63.16%。 
23 ”基于 多 模 态 脑 影像 数据 的 机 器 学 习 研 究 

除了 单 模 态 数据 ， 现 有 研究 还 尝试 结合 多 种 
模 态 脑 影 像 数据 对 精神 分 裂 症 患者 或 高 危 人 群 与 
健康 对 照 进 行 分 类 。 目 前 多 模 态 脑 影像 机 器 学 习 
分 类 研究 有 8 篇 ,总 样本 量 在 46 到 144 之 间 , 分 
类 正确 率 在 54.9% 到 100% 之 间 ， 常 与 Tl 加 权 像 
数据 结合 的 脑 影 像 数 据 有 静 息 态 功能 磁 共 振 成 像 
(resting state functional Magnetic Resonance Imaging， 
Is-fMRD 数 据 和 DTI 数据 。 

Peruzzo 等 人 (2015) 结 合 Tl 加 权 像 和 DTI 数 
据 ， 采 用 非 参 数 统计 检验 和 SVM 算法 选取 特征 
采用 多 核 学 习 MKL 算法 对 23 个 首发 精神 分 裂 症 
患者 和 23 个 健康 对 照 进行 分 类 ,正确 率 最 高 达到 
93.5%， 影 响 正 确 率 的 特征 包括 奋 仁 核 、 额 上 回 、 
额 下 回 、 苍 白 球 、 海 马 旁 回 的 灰质 体积 和 侧 脑 室 
体积 , 额 上 回 、 额 中 回 、 额 下 回 、 梭 状 回 、 海 马 
Se VL. MPE, HE i Se Jos PT GY BS Je EERE, H 
R. Jam. /SHW Ff BR IAS ey in PBK E fE o 
此 外 ，Sui 等 人 (2013) 提 出 一 种 多 模 态 融合 的 方 
法 一 mCCA (multi-set Canonical Correlation Analysis) 


Al jICA (joint Independent Component Analysis), 
将 rs-fMRI、 结 构 像 和 DTI 的 数据 两 两 结合 ， 对 
35 名 精神 分 裂 症 患者 和 28 名 健康 对 照 个 体 进行 
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分 类 ,发 现 单 模 态 数 据 的 分 类 正确 率 在 50%~70% 
之 间 , 多 模 态 数据 正确 率 在 60%~80% 之 间 。 另外， 
该 研究 团队 还 基于 rs-fMRI、T1 加 权 像 和 脑 电 数 
据 (Electroencephalogram，EEG) 采 用 独立 样本 t 检 
K, mCCA 和 SVM-RFE 选择 特征 ,应 用 SVM 算 
法 和 十 折 交 又 验 证 方法 在 43 个 精神 分 裂 症 患者 
和 48 个 健康 对 照 中 得 到 91% 的 分 类 正确 率 ,并且 
以 100% 的 正确 率 成 功 区 分 5 个 精神 分 裂 症 患者 
和 5 个 健康 对 照 个 体 (Sui et al., 2014)。 
虽然 现 阶段 大 部 分 多 模 态 脑 影 像 的 机 器 学 习 
研究 分 类 正确 率 较 高 , 但 此 类 研究 的 样本 量 通 常 
较 小 。 因 此 ， 多 模 态 脑 影像 数据 对 分 类 结果 的 影 
响 仍 需要 进一步 探讨 。 
2.4” 脑 影像 数据 和 行为 数据 相 结 合 的 机 器 学 习 

研究 

除 结合 不 同 模 态 的 脑 影 像 数 据 以 外 ,目前 也 
有 将 脑 影 像 数 据 和 行为 数据 相 结 合作 为 分 类 特征 
的 机 器 学 习 研 究 ， 现 有 研究 建议 将 脑 影 像 数据 和 
行为 数据 结合 能 提高 分 类 正确 率 。 

有 研究 将 灰质 、 白 质 、 脑 疹 液 体积 与 威 斯 康 
星 卡片 分 类 测试 (Wisconsin card sorting test, WCST) 
的 错误 率 结合 ， 利 用 独立 成 分 分 析 处 理 数据 ， 使 
用 SVM 算法 在 19 个 精神 分 裂 症 患者 和 16 个 健康 
对 照 的 数据 中 取得 91.58% 的 分 类 正确 率 , 证 明 
WCST 的 错误 率 和 脑 影 像 数 据 结合 能 有 效 区 分 患 
者 和 健康 对 照 (Chu et al., 2016)。Zarogianni 等 人 
(2017) 预 测 34 名 具有 家 族 遗 传 史 的 高 危 个 体 是 否 
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会 转变 为 精神 分 裂 证 患者 , 应 用 SVM-RFE 算法 
在 各 脑 区 的 灰质 密度 数据 、Rust Inventory of 
Schizotypal Cognitions (RISC) 问 卷 分 数 和 雷 氏 听 
觉 语 言 学 习 测 验 (Rey Auditory Verbal Learning 
Test, RAVLT) 得 分 中 进行 特征 选择 , 用 SVM 算法 
进行 预测 ,分 类 正确 率 达 到 94%， 高 于 仅 使 用 灰 
质 密度 数据 的 分 类 正确 率 (88%)。Ebdrup 等 人 
(2018) 对 46 个 首发 精神 分 裂 症 患者 和 58 个 健康 对 
照 进 行 分 类 ,结合 行为 数据 (包括 韦 氏 智力 量 表 第 
三 版 和 丹麦 成 人 阅读 测试 (Danish Adult Reading 
Test)) 和 T1 加 权 像 、DTI 和 EEG 的 数据 仅 获得 
51%~68% 的 分 类 正确 率 ,， 低 于 仅 使 用 认 知 数据 的 
分 类 结果 (60%~69%)， 稍 高 于 单独 使 用 单 模 态 数 
据 的 分 类 结果 (49%~56%)。 因 此 , 现 有 研究 提示 结 
合 行为 数据 和 脑 影 像 数 据 的 分 类 结果 可 能 优 于 单 
模 态 数据 的 分 类 结果 ,但 结合 这 两 类 数据 能 否 取 
得 高 正确 率 仍 有 待 进一步 探讨 。 


3 ”机 器 学 习 研究 的 局 限 


将 机 器 学 习 应 用 于 精神 分 裂 症 领域 , 利用 脑 
结构 特征 对 精神 分 裂 症 患者 、 高 危 人 群 与 健康 对 
照 进 行 分 类 ， 有 助 于 理解 疾病 的 生理 病理 机 制 。 
研究 数量 逐年 递增 ,但 仍 具有 一 定局 限 ， 特 别 是 
在 研究 样本 量 和 模型 泛 化 能 力 上 仍 存在 问题 ， 亚 
待 解决 。 

31 样本 量 
2 总 结 了 现 有 精神 分 裂 症 和 高 危 人 群 中 机 
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总 样本 量 
图 2 精神 分 裂 症 患者 、 高 危 人 群 基于 脑 结构 像 分 类 研究 的 总 样本 量 和 分 类 正确 率 
TE: SCZ: 精神 分 裂 症 ; HC: 健康 对 照 ; FEP: 首发 精神 分 裂 症 ; HR: 高 危 人 群 。 实 心 点 代表 最 高 分 类 正确 率 ; 空心 点 代表 
最 低 分 类 正确 率 ; 虚线 连接 同一 研究 中 相同 样本 量 的 最 高 与 最 低 分 类 正确 率 。 
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器 学 习 研 究 采用 的 总 样本 量 以 及 分 类 的 最 高 和 最 
低 正 确 率 。 如 图 2 所 示 , 样本 量 在 50 到 150 时 ， 最 
高 分 类 正确 率 较 高 ， 样 本 量 大 于 400 时 ， 最 高 正 
确 率 只 有 60%~72%。 出 现 小 样本 分 类 正确 率 高 而 
大 样本 分 类 正确 率 低 的 情况 可 能 有 如 下 原因 : 1) 
样本 量 小 导致 模型 不 稳定 和 测试 不 准确 。 训 练 样 
本 量 过 小 容易 导致 训练 不 充分 ,造成 模型 过 拟 合 
或 不 稳定 ; 测试 样本 量 过 小 ， 容 易 出 现 过 高 或 过 
低 的 分 类 正确 率 ， 即使 在 小 样本 测试 中 得 到 高 正 
确 率 仍 难以 验证 一 个 模型 的 性 能 。 有 研究 表明 ， 
验证 一 个 模型 的 有 效 性 至 少 需要 75 到 100 个 测试 
样本 (Beleites, Neugebauer, Bocklitz, Krafft, & Popp, 
2013); 2) 现 有 大 样本 研究 的 分 类 特征 远大 于 样本 
量 , 研究 中 未 进行 特征 选择 ， 容 易 造成 模型 过 拟 
合 ， 降低 分 类 正确 率 ; 3) 大 样本 研究 数据 来 自 多 个 
中 心 ， 患者 的 异 质 性 可 能 更 高 ， 从 而 降低 分 类 正 
确 率 。 

样本 量 不 足 是 现 阶段 精神 分 裂 症 领域 机 央 学 
习 研 究 面 临 的 一 大 问题 (Madsen et al., 2018)。 样 本 
量 不 足 的 主要 原因 包括 磁 共 振 扫 描 成 本 高 、 精 神 
分 裂 症 的 特殊 性 和 数据 共享 困难 。 高 昂 的 磁 共 振 
成 像 扫描 费用 和 较 长 的 扫描 时 间 导 致 研究 者 难以 
在 短 时 间 内 收集 大 量 脑 影像 数据 。 精 神 分 裂 症 患 
者 受到 临床 症状 和 药物 副作用 的 影响 ， 在 采集 脑 
影像 数据 时 需要 耗费 更 多 的 人 力 和 物力 , 采集 难 


现 该 元 模型 与 基于 所 有 数据 生成 的 模型 有 较 高 的 
相似 性 (Dluhos et al., 2017)。 因 此 , 合并 多 中 心 模 
型 为 解决 样本 无 法 共享 提供 了 一 种 新 思路 。 
3.2 泛 化 能 力 
机 器 学 习 的 目标 是 使 训练 得 到 的 模型 能 够 很 
好 地 适用 于 新 样本 ， 即 具有 较 好 的 泛 化 能 力 。 除 
了 样本 量 不 足 会 影响 模型 泛 化 能 力 外 ， 机 器 学 习 
训练 过 程 中 出 现 信 息 泄露 也 会 影响 泛 化 能 力 。 常 
见 的 信息 泄露 的 情况 是 使 用 同一 批 样本 调整 参数 
和 测试 结果 , 在 特征 选择 时 提前 使 用 测试 集 的 标 
签 ， 如 在 所 有 样本 中 进行 独立 样本 t 检验 选取 显 
著 脑 区 ， 再 进行 训练 集 、 测 试 集 和 验证 集 的 拆 分 。 
提前 使 用 测试 集 的 信息 ,虽然 能 得 到 高 正确 率 
但 是 不 能 反映 模型 真正 的 泛 化 能 力 。 研 究 者 在 今 
后 研究 中 应 避免 信息 泄露 并 使 用 垦 套 交叉 验证 
(Madsen et al., 2018; Dwyer et al., 2018), 使 评估 
结果 更 加 精确 ， 提 高 模型 泛 化 能 力 。 为 测试 泛 化 
能 力 , Dwyer 等 人 (2018) 建 议 未 来 可 设置 第 三 方 检 
测 机 构 ， 收 集 各 中 心 或 机 构 的 数据 ,一 旦 形成 间 
模型 ， 研 究 者 可 移交 第 三 方 机 构 ， 利 用 其 数据 进 
行 测试 ， 从 而 保证 较 好 的 泛 化 能 力 。 


4 未 来 研究 展望 


未 来 的 精神 分 裂 症 脑 影 像 机 器 学 习 研 究 可 以 
考虑 在 特征 中 加 入 用 药 情 况 、 临 床 症状 和 社会 人 


度 大 ， 因 此 与 精神 分 裂 症 有 关 的 脑 成 像 研究 样本 
量 通 常 较 小 。 除 此 之 外 ,多 中 心 数据 共享 困难 是 
也 是 可 能 的 原因 之 一 ,各 中 心 扫描 仪器 的 型 号 和 
参数 各 不 相同 ,并 且 存 在 数据 管理 、 伦 理 和 隐私 
保护 的 问题 。 

未 来 多 个 研究 机 构 / 中 心 可 以 通过 制定 详细 
协议 保障 被 试 隐私 和 数据 安全 ,统一 扫描 参数 和 
入 组 标准 ,在 不 违背 伦理 的 情况 下 实现 多 中 心 数 
据 共享 增 大 样本 量 。 研 究 者 在 纳入 多 中 心 数据 
时 ， 需 要 保证 入 组 标准 尽 可 能 一 致 ; 在 处 理 大 样 
本 数据 时 ， 进 行 数据 清洗 , 利用 降 维 和 特征 选择 
的 方法 保留 有 用 特征 , 保证 数据 质量 , 得 到 更 加 
可 信 的 结果 ， 从 而 利用 大 样本 数据 考察 脑 结构 特 
征 的 有 效 性 。 有 研究 者 提出 可 以 通过 合并 多 中 心 
模型 解决 样本 量 问 题 。 研 究 者 分 别 在 4 个 中 心 收 


分 别 使 用 4 个 中 心 的 数据 训练 模型 ， 利用 这 4 个 
模型 生成 最 终 的 元 模型 (the meta-modeD)。 研 究 发 


集 首发 精神 分 裂 症 患者 和 健康 对 照 的 脑 结构 数据 ， 


口 学 等 信息 。Kambeitz 等 人 (2015) 在 精神 分 裂 症 
患者 和 健康 对 照 的 脑 影像 机 器 学 习 研 究 中 , 将 特 
异性 和 敏感 性 作为 效应 量 ， 考 察 年 龄 、 阳 性 症状 
与 阴性 症状 比率 、 抗 精神 病 药 物 剂 量 对 分 类 结果 
的 影响 。 该 元 分 析 发 现 , 年龄 越 大 机 器 学 习 分 类 
的 敏感 性 越 高 ; 阳性 症状 与 阴性 症状 比率 越 大 特 
异性 越 高 ; 抗 精神 病 药 物 剂量 越 大 特异 性 越 高 。 
因此 ,在 区 分 不 同 病 程 的 患者 或 探究 预后 情况 时 ， 
可 以 纳入 临床 信息 和 社会 人 口 学 信息 ， 提 高 分 类 
表现 。 

近年 来 ， 随 着 计算 机 技术 的 高 速 发 展 ， 深 度 
学 习 开始 重新 获得 人 们 关注 。 深 度 学 习 是 以 人 工 
神经 网 络 为 架构 ， 对 数据 进行 表征 学 习 的 算法 
在 图 像 、 视 频 、 语 音 等 多 个 领域 均 表 岗 优异 (Bengio， 
Courville, & Vincent, 2013; Lecun, Bengio, & Hinton, 
2015; Schmidhuber, 2015)。Pinaya 等 人 (2016) 使 用 
深度 信念 网 络 (Deep Belief Network), 在 143 例 精 
神 分 裂 症 患 者 和 83 例 健康 对 照 中 得 到 了 73.6% 的 


| = 


262 心 理 


~ 


第 28 卷 


分 类 正确 率 (敏感 性 76.37%, 特异 性 70.74%), FH 
高 于 使 用 SVM 算法 的 正确 率 (68.1%)。Dwyer 等 
人 (2018) 指 出 ,深度 学 习 需 要 大 样本 数据 来 避免 
维度 灾难 和 过 拟 合 。 因 此 , 研究 者 可 以 在 获得 大 
样本 数据 的 基础 上 ， 尝 试 使 用 深度 学 习 的 方法 进 
行 分 类 , 探究 精神 分 裂 症 的 内 在 机 制 。 

网 有 研究 的 数据 处 理 流程 和 结果 报告 都 不 相 
同 ， 由 于 缺乏 具体 信息 和 使 用 方法 的 差异 , 不同 
研究 之 间 很 难 进 行 比 较 。 据 此 Riley (2019) 指 出 将 


机 器 学 习 应 用 于 不 同学 科 和 领域 中 时 ， 应 建立 统一 
的 数据 分 析 和 结果 报告 标准 。 
5 总 结 


机 器 学 习 技术 从 数据 中 提取 有 用 信息 ， 可 以 
协助 研究 者 在 个 体 水 平 上 进行 预测 ， 探 究 精 神 分 
裂 症 的 特点 和 内 在 机 制 ,帮助 寻找 生物 标记 物 、 
实现 精神 疾病 的 早期 识别 。 本 文 主要 从 脑 结构 像 
出 发 , 综述 了 单 模 态 、 多 模 态 脑 影像 和 结合 行为 
数据 与 脑 影像 的 机 器 学 习 研 究 。 单 模 态 脑 影 像 的 
机 器 学 习 分 类 正确 率 在 36.84% 到 98% 之 间 ， 多 基 
于 Tl 加 权 像 ,结果 提示 额 叶 和 匡 叶 的 脑 结构 特征 
可 以 有 效 区 分 精神 分 裂 症 患者 或 高 危 人 群 和 健康 
对 照 ; 基于 DTI 的 机 器 学 习 研 究 多 采用 弥散 张 量 
值 为 特征 ,但 因 其 样本 量 小 且 现 有 研究 少 ,各 研 
究 者 提出 的 能 提高 分 类 正确 率 的 脑 区 或 纤维 特征 
大 不 相同 ,尚未 达成 统一 意见 。 多 模 态 脑 影像 的 
分 类 正确 率 在 54.9%~100% 之 间 ， n i 
类 正确 率 高 ,但 样本 量 小 ， 多 模 态 数据 是 否 
优 于 单 模 态 数据 并 有 效 提高 分 类 正确 率 ， ait 
A E 
oe 效果 ,但 能 否 显 
著 提 高 分 类 正确 率 仍 待 进一步 验证 。 目 前 精神 分 
ee 
能 力 弱 等 局 限 ， 未 来 还 需要 在 多 中 心 的 大 样本 中 
进行 模型 训练 和 验证 ， 以 求 获得 更 可 靠 的 模型 和 
更 有 效 的 特征 , 才能 在 临床 实践 中 发 挥 更 大 作用 。 
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A machine learning approach 
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Abstract: Machine learning is a promising approach for mental disorders. In recent years, machine learning 
based on T1 weighted imaging and Diffusion Tensor Imaging (DTI) data has been used to investigate the 
psychopathology and underlying mechanisms of schizophrenia patients and high-risk population. The 
findings from the previous literature suggest that structural features of frontal lobe and temporal lobe can 
improve classification performance. In addition, the combination of behavioural performances and the 
features of brain structure is superior to the single-modality structural images on classification accuracy. 
However, the existing empirical studies classifying schizophrenia patients or high-risk population from 
controls are limited in sample size and generalization ability. 
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